跳到主要内容
版本:1.9.x

v1.9.0

发布日期

2026 年(待发布)


SDK 相关改动

新功能

  • SDK: 支持 GPU 参数配置 (#1047)

  • SDK: rock datasets list 支持跨 region OSS 快速列出数据集 (#1010)

  • SDK: rock storage get 命令,支持从 OSS 下载归档的沙箱日志 (#962)

Bug 修复

  • SDK: 修复生成的 Harbor job 名称中含非法字符的问题 (#1031)

  • SDK: 修复 OSS 上传时 wget -c 断点续传导致文件覆盖失败的问题 (#992)


沙箱 (Sandbox)

新功能

  • 支持沙箱重启 (restart) 功能 (#1001)

  • 新增 /delete 端点,STOPPED 状态的沙箱可级联转为 DELETED(支持 --rm 容器自动清理)(#1038)

  • 引入 SandboxStateMachine,统一管理沙箱生命周期状态流转 (#988)

  • Admin 端新增 ops-jobs API,支持 DB 持久化状态和多 Pod 安全并发 (#1027)

  • Admin 端新增 API 参数校验 (#985)

  • K8s Operator 支持磁盘配额限制 (#994)

Bug 修复

  • 修复 #988 FSM 重构后 stop reason 丢失的问题 (#1021)

  • 修复 RayOperator.get_status() 中 actor 不存在时的异常处理 (#1062)

  • 修复 K8sOperator.get_status() 中 CRD 不存在时的异常处理 (#1068)

  • 修复沙箱 stop() 时 start_time 缺失导致 stop_time 未写入的问题(start 失败的沙箱)(#1020)

  • 修复 start() 未正确委托到 start_async() 导致 meta store 写入缺失的问题 (#1051)

  • 修复 Admin SandboxTable 在 DB 重启后连接失效时的重试机制 (#987)

重构

  • Meta-store: 新增 Redis 合并语义,支持 archive 和 alive-key 字段过滤 (#1037)

部署 (Deployments)

新功能

  • Docker 容器创建拆分为 docker create + docker start -a,支持更精细的容器生命周期控制 (#1012)

  • Docker rootfs XFS 项目 ID 与沙箱日志目录共享配额 (#1013)


任务调度 (Scheduler)

新功能

  • FileCleanupTask 切换到 find -delete,并增加最小路径安全检查 (#967)

  • 新增 SandboxLogArchiveTask:基于 DB 驱动的沙箱日志归档任务,替换旧的 sentinel 文件方案 (#1025)

  • Ray 日志清理增强:(#1029)

    • PART 1 清理 runtime_env_setup-* 文件(覆盖 hex 后缀)

    • PART 2 清理轮转的 daemon 日志(raylet.N.outgcs_server.N.err 等)

    • session_latest/logs 支持 PID 感知清理 + logs/old 目录清理

    • 保护 agent-* 等 daemon 文件不被 PID probe 误清

  • 配置去重:通过 base config 继承机制消除 region 级别的 scheduler.tasks 重复配置 (#1003)

Bug 修复

  • FileCleanupTask: 修复 exclude_dirs 白名单机制因 -depth 导致 -prune 失效的问题,改用 -not -path (#1072)

  • FileCleanupTask: 修复 check_pid_exists 中 PID/TID 复用导致的误判,增加进程名验证 (#1074)

  • FileCleanupTask: _discover_candidates 使用 find -type d 避免误匹配 daemon 日志文件 (#1025)

  • ImageCleanupTask: 拆分 prune(幂等操作)和 docuum 启动逻辑 (#1023)

  • SandboxLogArchiveTask: 修复跨事件循环调用 asyncpg 连接池的问题,DB 调用派发回主循环 (#1025)

  • Scheduler: 增加 60s 超时限制防止跨循环 dispatch 挂起 (#1025)


Rocklet

新功能

  • 新增 rootfs/log/kata 分盘使用率监控 (#983)

Bug 修复

  • 修复 PR #985 引入的 NonBlankStr 校验导致 /execute/read_file 返回 422 的回归 (#1065)

  • 修复 UploadResponse 中 successfile_name 未正确设置的问题 (#1060)

  • 使用 cgroup 指标获取容器内存,替代 psutil(修复 DinD 场景下指标不准的问题)(#1017)


Harbor (Agent Job)

新功能

  • Harbor 环境配置新增 tracking 支持,Job 配置新增 tracking config 和 api_key 字段 (#999)

CI/测试

  • CI: admin+network 测试仅在 push 时运行,PR 时跳过 (#1040)

  • 修复 docker disk-limit 测试用例、跨平台 CI 兼容性问题 (#967)


文档

  • 新增 v1.8.x 沙箱并发创建 benchmark 报告和 scheduler 用户指南 (#1035)

  • README 更新 v1.4.0 – v1.8.0 发版记录,修复 release notes 链接 (#1034)